智能论文笔记

A Multi-turn Machine Reading Comprehension Framework with Rethink Mechanism for Emotion-Cause Pair Extraction

Changzhi Zhou , Dandan Song , Jing Xu , Zhijing Wu

分类：自然语言处理 | 人工智能

2022-09-16

情感双对提取（ECPE）是情感原因分析中的一项新任务，它从情感文档中提取潜在的情感因子对。最近的研究使用端到端方法来应对ECPE任务。但是，这些方法要么患有标签稀疏问题，要么无法模拟情绪与原因之间的复杂关系。此外，他们都不考虑条款的明确语义信息。为此，我们将ECPE任务转换为文档级机器阅读理解（MRC）任务，并提出了具有重新INK机制（MM-R）的多转移MRC框架。我们的框架可以模拟情绪和原因之间的复杂关系，同时避免产生配对矩阵（标签稀疏问题的主要原因）。此外，多转弯结构可以融合情绪和原因之间的明确语义信息流。关于基准情绪的广泛实验导致语料库证明了我们提出的框架的有效性，该框架的表现优于现有的最新方法。

translated by 谷歌翻译

Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in Artificial Intelligence

Xiang Bai , Hanchen Wang , Liya Ma , Yongchao Xu , Jiefeng Gan , Ziwei Fan , Fan Yang , Ke Ma , Jiehua Yang , Song Bai

分类：人工智能

2021-11-18

人工智能（AI）为简化Covid-19诊断提供了有前景的替代。然而，涉及周围的安全和可信度的担忧阻碍了大规模代表性的医学数据，对临床实践中训练广泛的模型造成了相当大的挑战。为了解决这个问题，我们启动了统一的CT-Covid AI诊断计划（UCADI），其中AI模型可以在没有数据共享的联合学习框架（FL）下在每个主机机构下分发和独立地在没有数据共享的情况下在每个主机机构上执行。在这里，我们认为我们的FL模型通过大的产量（中国测试敏感性/特异性：0.973 / 0.951，英国：0.730 / 0.942），与专业放射科医师的面板实现可比性表现。我们进一步评估了持有的模型（从另外两家医院收集，留出FL）和异构（用造影材料获取）数据，提供了模型所做的决策的视觉解释，并分析了模型之间的权衡联邦培训过程中的性能和沟通成本。我们的研究基于来自位于中国和英国的23家医院的3,336名患者的9,573次胸部计算断层扫描扫描（CTS）。统称，我们的工作提出了利用联邦学习的潜在保留了数字健康的前景。

translated by 谷歌翻译

Hierarchical Image Classification with A Literally Toy Dataset

Long He , Dandan Song , Liang Zheng

分类：计算机视觉

2021-11-01

Image Classification中的无监督域适应（UDA）仍然是一个很大的挑战。在现有的UDA图像数据集中，通常以扁平的方式组织类，其中可以训练普通分类器。然而在某些情况下，平面类来自一些基本类。例如，Buggies属于类鸟。我们定义类别的分类任务，其中类具有上述特征，并且平面类和基类被分级地组织为分层图像分类。直观地，利用这种分层结构将受益分层图像分类，例如，两个容易混淆的类可以属于完全不同的基类。在本文中，我们通过从标签层次结构中学到的融合功能来改善分类的性能。具体而言，我们训练由分层标签和UDA技术监督的特征提取器，它将输出输入图像的多个功能。随后将该特征连接以预测最优质的粒度。本研究与名为Lego-15的新数据集进行。由乐高砖的合成图像和真实图像组成，乐高 - 15数据集包含15级砖块。每个类源自粗级标签和中级标签。例如，类别“85080”与砖（粗略）和砖（中间）相关联。在此数据集中，我们证明我们的方法在分层图像分类中对UDA的基线进行了一致的改进。广泛的消融和变体研究提供了进入新数据集的见解和研究算法。

translated by 谷歌翻译

EPIC-KITCHENS VISOR Benchmark: VIdeo Segmentations and Object Relations

Ahmad Darkhalil , Dandan Shan , Bin Zhu , Jian Ma , Amlan Kar , Richard Higgins , Sanja Fidler , David Fouhey , Dima Damen

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-26

我们介绍了遮阳板，一个新的像素注释的新数据集和一个基准套件，用于在以自我为中心的视频中分割手和活动对象。遮阳板注释Epic-kitchens的视频，其中带有当前视频分割数据集中未遇到的新挑战。具体而言，我们需要确保像素级注释作为对象经历变革性相互作用的短期和长期一致性，例如洋葱被剥皮，切成丁和煮熟 - 我们旨在获得果皮，洋葱块，斩波板，刀，锅以及表演手的准确像素级注释。遮阳板引入了一条注释管道，以零件为ai驱动，以进行可伸缩性和质量。总共，我们公开发布257个对象类的272K手册语义面具，990万个插值密集口罩，67K手动关系，涵盖36小时的179个未修剪视频。除了注释外，我们还引入了视频对象细分，互动理解和长期推理方面的三个挑战。有关数据，代码和排行榜：http：//epic-kitchens.github.io/visor

translated by 谷歌翻译

CARNet:Compression Artifact Reduction for Point Cloud Attribute

Dandan Ding , Junzhe Zhang , Jianqiang Wang , Zhan Ma

分类：计算机视觉

2022-09-17

为基于几何的点云压缩（G-PCC）标准开发了基于学习的自适应环滤波器，以减少属性压缩工件。提出的方法首先生成多个最可行的样品偏移（MPSO）作为潜在的压缩失真近似值，然后线性权重以减轻伪影。因此，我们将过滤后的重建驱动尽可能靠近未压缩的PCA。为此，我们设计了一个由两个连续的处理阶段组成的压缩工件还原网络（CARNET）：MPSOS推导和MPSOS组合。 MPSOS派生使用两个流网络来模拟来自直接空间嵌入和频率依赖性嵌入的局部邻域变化，在该嵌入中，稀疏的卷积被利用可从细微和不规则分布的点中最佳汇总信息。 MPSOS组合由最小平方误量学指导，以进一步捕获输入PCAS的内容动力学，从而得出加权系数。 Carnet作为GPCC的环内过滤工具实现，其中这些线性加权系数被封装在比特斯流中，并以忽略不计的比特率开销。实验结果表明，对最新的GPCC的主观和客观性都显着改善。

translated by 谷歌翻译

Learning to Re-weight Examples with Optimal Transport for Imbalanced Classification

Dandan Guo , Zhuo Li , Meixi Zheng , He Zhao , Mingyuan Zhou , Hongyuan Zha

分类：机器学习

2022-08-05

不平衡的数据对基于深度学习的分类模型构成挑战。解决不平衡数据的最广泛使用的方法之一是重新加权，其中训练样本与损失功能的不同权重相关。大多数现有的重新加权方法都将示例权重视为可学习的参数，并优化了元集中的权重，因此需要昂贵的双重优化。在本文中，我们从分布的角度提出了一种基于最佳运输（OT）的新型重新加权方法。具体而言，我们将训练集视为其样品上的不平衡分布，该分布由OT运输到从元集中获得的平衡分布。训练样品的权重是分布不平衡的概率质量，并通过最大程度地减少两个分布之间的ot距离来学习。与现有方法相比，我们提出的一种方法可以脱离每次迭代时的体重学习对相关分类器的依赖性。图像，文本和点云数据集的实验表明，我们提出的重新加权方法具有出色的性能，在许多情况下实现了最新的结果，并提供了一种有希望的工具来解决不平衡的分类问题。

translated by 谷歌翻译

TWEET-FID: An Annotated Dataset for Multiple Foodborne Illness Detection Tasks

Ruofan Hu , Dongyu Zhang , Dandan Tao , Thomas Hartvigsen , Hao Feng , Elke Rundensteiner

分类：自然语言处理 | 人工智能 | 机器学习

2022-05-22

食源性疾病是一个严重但可以预防的公共卫生问题 - 延迟发现相关的暴发导致生产力损失，昂贵的召回，公共安全危害甚至生命丧失。尽管社交媒体是识别未报告的食源性疾病的有前途的来源，但缺乏标记的数据集来开发有效的爆发检测模型。为了加快基于机器学习的疫苗爆发检测模型的开发，我们提出了推文-FID（Tweet-Foodborne疾病检测），这是第一个用于多种食源性疾病事件检测任务的公开注释的数据集。从Twitter收集的Tweet-FID带有三个方面：Tweet类，实体类型和老虎机类型，并带有专家以及众包工人生产的标签。我们介绍了利用这三个方面的几个域任务：文本相关性分类（TRC），实体提及检测（EMD）和插槽填充（SF）。我们描述了用于支持这些任务模型开发的数据集设计，创建和标签的端到端方法。提供了这些任务的全面结果，以利用Tweet-FID数据集上的最新单项和多任务深度学习方法。该数据集为未来的Foodborne爆发检测提供了机会。

translated by 谷歌翻译

Fine-Grained Population Mobility Data-Based Community-Level COVID-19 Prediction Model

Pengyue Jia , Ling Chen , Dandan Lyu

分类：机器学习

2022-02-13

预测抗流动过程中感染的数量对政府制定抗流动策略极为有益，尤其是在细粒度的地理单位中。以前的工作着重于低空间分辨率预测，例如县级和预处理数据到同一地理水平，这将失去一些有用的信息。在本文中，我们提出了一个基于两个地理水平的数据，用于社区级别的COVID-19预测，该模型（FGC-COVID）基于数据。我们使用比社区更细粒度的地理水平（CBG）之间的人口流动数据来构建图形，并使用图形神经网络（GNN）构建图形并捕获CBG之间的依赖关系。为了预测，为了预测更细粒度的模式，引入了空间加权聚合模块，以将CBG的嵌入基于其地理隶属关系和空间自相关，将CBG的嵌入到社区水平上。在300天LA COVID-19数据中进行的大量实验表明，我们的模型的表现优于社区级Covid-19预测的现有预测模型。

translated by 谷歌翻译

Acquisition and Representation of User Preferences Guided by an Ontology

Rahma Dandan , Sylvie Despres , Karima Sedki

分类：人工智能

2022-01-11

我们的食品偏好指导我们的食物选择，反过来影响我们的个人健康和社交生活。在本文中，我们采用了一种方法，使用OWL2中表达的域本体进行支持，以支持正规主义CP-Net中的偏好的获取和表示。具体而言，我们展示了域本体论的构建和问卷设计来获取和代表偏好。偏好的收购和代表在大学食堂的领域实施。我们在这项初步工作中的主要贡献是获取偏好，并优选地通过本体中所代表的域知识来获取偏好。

translated by 谷歌翻译

RIO: Rotation-equivariance supervised learning of robust inertial odometry

Caifa Zhou , Xiya Cao , Dandan Zeng , Yongliang Wang

分类： (统计)机器学习 | 机器学习

2021-11-23

本文介绍了旋转等级，作为训练惯性内径型号的自我主管。我们证明自我监督方案在训练阶段以及推理阶段提供了强大的监督信号。它降低了对训练鲁棒模型的大量标记数据的依赖性，并且可以使用各种未标记的数据更新模型。此外，我们基于不确定性估计提出了自适应测试时间训练（TTT），以便提高惯性内径术的概括性与各种看不见的数据。我们在实验中展示了具有30％数据训练的旋转等因素监督的惯性内径（RIO）验证的训练，达到了与整个数据库训练的模型的对比。Adaptive TTT在所有情况下提高了模型性能，在若干方案下会产生超过25％的改进。

translated by 谷歌翻译